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摘 要 : [目的 /意义 ] 数 据 故事 化 实现 数据 可 视 化 与 叙事 的 关联 融合 ,有 利于 公众 感知 及 认 知 复杂 数据 ,提高 数据 重用 
率 。[ 方法/ 过程] 通过 提取 新 华 网 260 个 数据 新 闻 故 事 题目 并 提炼 高 频 词 ,确定 27 个 卫生 健康 类 热点 数据 新 闻 
故事 。 根据 扎根 理论 并 采用 质 性 分 析 软 件 NVivoll 对 热点 数据 新 闻 进 行 三 级 编码 ,最 终 得 到 数据 新 闻 实 践 的 11 
个 初始 范畴 ,并 凝练 出 6 个 主 范 畴 。 [ 结果 /结论 ] 得 出 数据 故事 化 实践 路 径 的 理论 模型 及 特征 。 数 据 故事 可 用 于 


知识 发 现 、 数 据 解读 .服务 增值 等 方面 。 


奚 名 词 ; 数据 故事 化 ”数据 新 闻 “NVivo 11 扎根 理论 逻辑 私事 


距 类 号 : G253 
牙 : 10. 13266/j. issn. 0252 -3116.2021. 14. 014 
名 

ls5| 言 


CD 数据 科学 领域 致力 于 提升 公众 对 数据 的 认 知 ,但 复 
医嘱 涩 .村 燥 海 量 动 态 生长 的 数据 使 公众 难以 挖掘 到 
存 价值 的 数据 资源 ,更 难 厘 清 数据 之 间 的 关联 关系 , 导 
致 高 价值 的 数据 资源 被 搁置 "1 。R. Kosara 和 本 Mack- 
ialag 指出 人 类 擅长 用 故事 和 可 视 化 传递 信息 。 数 据 
故 种 化 ( Data Storytelling) 联 合 可 视 化 和 叙事 形成 语义 互 
联 = 夺 予 数据 逻辑 ,洞察 数据 隐藏 价值 ,提升 了 公众 对 数 
据 的 认 知 敏锐 度 。 数 据 科学 领域 引用 数据 故事 化 表征 方 
式 扬 示 数据 之 间 的 隐 性 关系 ,赋予 数据 发 声 .解释 .说服 和 
引导 作用 。 目 前 ,数据 科学 新闻 传媒 .计算 机 科学 等 领域 
积极 探索 了 数据 的 故事 化 ,但 是 细 粒 度 的 实践 应 用 路 径 还 
尚未 明晰 。 本 文 从 数据 新 闻 的 小 视角 去 探索 数据 故事 化 
的 实践 应 用 路 径 ,为 数据 故事 的 制作 提供 理论 指导 。 


2 相关 研究 


数据 故事 化 的 研究 主要 包括 :理论 框架 探析 、 技 术 
开发 .场景 应 用 。 
(1) 数 据 故事 的 理论 框架 。 数 据 故 事 的 概念 在 学 
术 界 尚未 得 到 统一 ,相关 术语 有 数据 故事 化 .可 视 故 事 


化 .用 数据 讲 故 事 ,数据 叙事 .数据 新 闻 等 ,虽然 术语 称 
谓 存在 差异 ,但 都 表现 为 “数据 + 可 视 化 + 叙述 ”的 形 
式 。 朝 乐 门 等 ”认为 数据 故事 化 是 将 数据 关联 至 特定 
的 场景 ,并 采用 叙述 揭露 数据 关系 。F. EL Outa 等 ”将 
数据 故事 界定 为 信息 的 结构 化 组 织 , 通 常会 采用 可 视 
化 方式 表征 。C. Zhang” 认为 数据 故事 化 的 理论 框架 
包 插 :产品 层 .知识 系统 层 .用 户 层 , 旨 在 实现 隐 性 知识 
显 性 化 ,从 而 创造 新 知识 。 目 前 数据 故事 化 还 缺乏 通 
用 的 理论 模型 ,起 待 构建 指导 性 的 理论 框架 。 

(2) 数 据 故 事 的 技术 开发 。 自 数据 故事 化 提出 以 
来 ,学 术 界 致力 于 探索 故事 的 自动 化 生成 技术 。 当 前 
数据 故事 的 技术 开发 有 :设计 自动 化 生成 系统 、 构 架 数 
据 故 事实 现 技 术 框 架 指 南 。J. Ni 等 中 采用 深度 学 习 
技术 从 灾难 新 闻 中 提取 三 元 组 并 以 图 形 的 方式 展示 了 
灾难 事件 演化 过 程 ,发 现 数据 叙事 促进 了 公众 深刻 理 
解 灾难 事件 的 发 展 概况 。 朝 乐 门 “采用 数据 科学 与 数 
据 工 程 结合 的 方法 ,提出 数据 故事 自动 生成 流程 并 设 
计 故 事 的 工程 化 研发 参考 架构 。D. Shi 等 ”开发 了 新 
的 数据 故事 生成 系统 Calliope, 它 通过 相关 设备 实现 自 
动 生成 过 程 ,将 数据 的 电子 表格 转换 成 数据 故事 ,并 通 
过 对 照 实 验 法 验证 了 Calliope 系统 的 可 操作 性 。H. 
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O. Obie 等 (中 开发 了 Gravity 系统 ,Gravity 系统 可 以 整 
合 可 视 化 数据 故事 创建 的 全 过 程 ,并 按照 逻辑 顺序 排 
列 可 视 化 集合 ,支持 连贯 叙述 和 视觉 效果 ,降低 公众 认 
知 负荷 。Y.R. Cao 等 "提出 VisGuide 系统 可 以 协助 
用 户 创建 上 下 文 可 视 化 序列 数据 ,创建 结构 化 的 数据 
故事 。 技 术 提高 了 数据 故事 生成 的 效率 ,但 系统 的 普 
及 性 不 高 并 对 公众 存在 着 操作 障碍 。 

(3 ) 数 据 故 事 化 的 应 用 场景 。 数 据 故 事 化 应 用 场 
景 主要 有 数据 新 闻 、 商 务 演示 、 学 术 交 流 "” 和 开放 数 
据 ”。 许 向 东 “ 将 线 型 叙事 .组 合 叙事 .交互 型 叙事 
作为 新 闻 人 氢 事 的 3 种 方法 ,为 “数据 讲 故事 "给 予 了 理 
论 支持 。 李 岩 等 "在 《数据 新 闻 手册 》 的 基础 上 运用 
文本 分 析 方 法 曾 明 了 数据 新 闻 讲 故事 的 原理 。V. J 
CArevalo 等 ' 中 认为 科学 交流 中 的 故事 情节 能 够 增强 
科 党 创新 。N，0，Brolehin 等 “ 指出 数据 故事 化 帮 
助手 开放 数据 平台 的 用 户 更 好 地 获取 原始 数据 信息 。 
等 中 采用 单 案例 研究 并 依托 “5W” 传播 理论 提出 
了 组 府 开 放 数 据 故事 化 的 实现 模式 。 
< 十 综 上 所 述 ,数据 故事 化 研究 处 于 摸索 阶段 ,表现 
名 相关 成 果 主要 聚 焦 于 数据 科学 .新闻 传播 学 . 计 
算 相 科学 等 领域 ,在 图 情 档 学 科 探索 较 少 ;@ 帮 事 生成 
的 我 术 方法 在 计算 机 领域 已 经 取得 一 定 的 成 果 , 但 是 
藻 能 延伸 到 其 他 领域 尚 待 验证 ;@) 需 进一步 探寻 通用 
的 型 论 框架 及 模型 。 数 据 故事 广泛 应 用 于 数据 新 闻 ， 


数据 新 闻 网 


] 区 得 


该 领域 积累 了 丰富 的 数据 故事 案例 ,已 相对 成 熟 。 数 
据 故 事 报 道 方式 最 早 可 以 追溯 到 17 世纪 ,如 1821 年 
卫 报 “读者 栏目 ”以 丰富 的 数据 图 表 证 明了 在 校 学 生 
人 数 并 非 教 育 改革 者 所 认为 的 学 生 数量 ,标志 着 用 数 
据 讲 故事 的 开端 。 随 之 专业 的 数据 新 闻 制 作 平台 
ProPublica Nerd Blog .Online Journalism Blog 等 -站 也 
应 运 而 生 ,数据 新 闻 的 方法 .手段 、 策 略 值得 其 他 领域 
背 鉴 。 本 文 运 用 扎根 理论 方法 深度 解构 数据 新 闻 的 实 
现 过 程 ,通过 小 视角 方式 阐明 数据 讲 故事 的 路 径 。 
3 ”研究 设计 
3.1 研究 方法 

扎根 理论 是 从 原始 资料 中 系统 归纳 出 新 理论 ,是 
一 种 灵活 且 系 统 的 质 性 研究 方法 ,允许 建构 的 理论 回 
溯 到 原始 数据 ,适用 于 研究 的 探索 性 阶段 ””。 数 据 
故事 化 实践 应 用 尚 处 于 发 展 初期 , 较 宜 选择 扎根 理论 
作为 研究 方法 。B.，Glaser 等 认为 “一 切 缘 为 数据 ”， 
包 插 访谈、 观察. 反思、 文本 、 图 片 .视频 等 ,可 用 于 解决 
社会 科学 中 理论 与 经 验 研究 的 脱节 问题 。 由 于 数据 新 
闻 呈 现 的 结果 不 是 原始 资料 , 故 本 文 不 分 析 数 据 新 闻 
的 内 容 ,只 观察 .归纳 数据 新 闻 的 文本 、 数 据 和 图 片 的 
表现 特质 ,其 本 身 特征 仍 属于 原始 资料 范畴 。 本 文 根 
据 扎根 理论 思想 :问题 产生 一 数据 收集 一 数据 人 处理 一 
理论 初 构 “ ,得 出 整体 研究 思路 如 图 1 所 示 : 


特定 时 段 数据 新 闻 


选择 性 编码 << 主轴 编码 << 玫 


图 1 整体 研究 思路 


如 图 1 所 示 :中 通过 文献 调研 提出 研究 问题 , 即 实 
践 应 用 过 程 中 数据 新 闻 故 事 是 如 何 生成 的 ? @) 搜 集 新 
华 网 特定 时 间 段 内 的 数据 新 闻 , 对 新 闻 题 目 中 出 现 的 
高 频 词 ,用 词 云 确定 热点 数据 新 闻 , 并 作为 样本 ;@ 将 
样本 数据 新 闻 导 入 质 性 研究 工具 NVivoll 进行 开放 式 
编码 ,形成 初始 概念 ;由 将 初始 概念 归纳 出 初始 范畴 并 
关联 ,形成 主轴 编码 ;@ 在 主轴 编码 基础 上 开展 选择 性 
编码 ,建立 主 范畴 之 间 的 逻辑 关系 ;@@ 另 选取 样本 总 量 
1/4 的 数据 新 闻 作 为 理论 饱和 度 检 验 ,理论 饱和 后 则 
构建 数据 新 闻 实践 路 径 的 理论 模型 。 


3.2 ”样本 选取 

新 华 网 是 国内 较 早 开 展 数据 新 闻 实 践 的 媒体 机 
构 ,其 (数据 新 闻 》 栏 目的 稿件 覆盖 范围 广泛 且 专 业 
程度 居于 同类 媒体 领先 地 位 ,已 累计 播发 近 千 期 ” 。 
新 华 网 《数据 新 闻 》 栏 目 分 类 有 10 种 ,由 于 “ 政 经 事 ” 
与 “讲习 所 ”为 政策 解读 类 新 闻 ,本 文 不 统计 该 类 栏 
目下 的 新 闻 数 量 , 选 取 其 余 8 种 类 型 ,经 过 筛选 得 到 
有 效 数据 新 闻 260 个 (搜集 时 间 为 2019 年 7 月 9 日 
至 2020 年 7 月 9 日 ) ,新 闻 类 型 及 数量 分 布 如 表 1 
所 示 : 
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以 数据 新 闻 为 例 [J]. 图 书 情报 工作 ,2021 ,65(14) :119 -127. 


表 1 新 华 网 数据 新 闻 类 型 和 数量 分 布 


类 型 数量 (个 ) 
数据 观 8 
第 一 时 间 48 
数 问 民 生 128 
数 极 客 3 
涨 知识 18 
人 文 说 9 
健康 解码 3 
漫 生 活 15 
总 计 260 
新 华 网 数据 新 闻 内 容 涉 及 生活 的 多 个 方面 ,覆盖 


主要 展示 数据 可 视 化 技术 ;第 一 时 间 " 是 以 数据 故事 
人 王 忒 讲述 国内 大 事 新 间 入 数 问 民生 "发布 百姓 关注 
的 绢 活 事件 ， 数 极 客 " 是 黑 科 技 展示 ,发布 内 容 较 少 ; 
“中 知识 "是 普及 日 常生 活 的 基本 知识 ”人文 说 ”借助 


数据 分 析 人 物 生命 历程 轨迹 和 文化 ;“ 健 康 解码 "公布 
健 恨 类 的 数据 新 闻 ;“ 漫 生活 "用 数据 图 文 展示 动漫。 
< 数据 新 闻 题名 可 以 映射 主题 内 容 ,分 析 题名 有 助 
别 出 热 点 选 题 , 采 用 BDP 生成 词 云 如 图 2 所 示 : 
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a 
总 日 作 水 城市 指南 游 
车 生 信 了 i 


炎 运 区 公 过 | 全 可 晤 
SB 导 啤 冬 = 一 份 | 
二 ;站 国 [有 Re 
三 “计数 说 沙 [] 阐 测字 
© 2 图 报告 a 大 地 国生 


好 了 吗 天 记性 必 化 多 少 行业 
图 2 新 华 网 数据 新 闻 题名 词 云 


260 个 数据 新 闻 主 要 涵盖 :确诊 北京 .新 增 、 病 
历 .肺炎 等 词 ,青睐 于 卫生 健康 类 选 题 。 由 于 新 冠 疫情 
的 原因 ,卫生 健康 成 为 社会 热切 关注 的 焦点 ,本 文 最 终 
选 定 27 个 卫生 健康 类 数据 新 闻 为 扎根 样本 。 
3.3 数据 编码 过 程 

数据 新 闻 是 数据 故事 化 的 应 用 之 一 ,其 策划 、 选 
题 .主题 提炼 数据 萃取 及 可 视 化 等 共同 构造 了 数据 故 
事 ” 。 本 研究 数据 编码 过 程 由 2 位 博士 生 完成 ,编码 
结果 由 4 位 博士 生 及 1 位 领域 专家 共同 商讨 ,再 由 1 
位 博士 生 进行 理论 饱和 度 检验 。 
3.3.1 开放 式 编码 

开放 式 编码 是 扎根 理论 的 初始 阶段 ,是 将 收集 的 


资料 打 碎 并 赋予 概念 的 过 程 ”: 。 新 华 网 数据 新 闻 导 
出 格式 为 JPG 和 PNG ,属于 图 片 格式 ,每 张 图 片 代表 一 
个 数据 新 闻 故 事 , 由 叙事 文本 .数据 可视化 图 表 等 内 
容 组 成 。 本 文 借助 质 性 研究 工具 NVivoll 对 新 闻 故 事 
逐个 编码 ,归纳 其 中 有 关 数 据 故事 化 构造 的 表征 特质 ， 
每 个 数据 新 闻 出 现 一 个 特质 或 多 个 相同 特质 仅 做 一 次 
编码 。 通 过 不 断 地 比较 、 探 讨 及 梳理 , 共 得 到 413 条 原 
台 语 句 ,50 个 初始 概念 (al-a50 ) ,经 过 合并 提炼 出 11 个 
初始 范畴 (Al-Al1 ) 。 由 于 一 句 话 .一 段 文 字 、 一 个 图 表 
等 表现 的 特质 作为 开放 式 编码 资料 的 表征 形式 , 癌 于 篇 
幅 , 仅 列举 了 部 分 资料 ,开放 式 编码 结果 见 表 2。 
3.3.2 主轴 编码 

主轴 编码 是 在 开放 式 编码 的 基础 上 ,通过 聚 类 发 
现 范畴 之 间 的 关系 “ 。 基 于 开放 式 编码 的 11 个 初始 
范畴 ,进行 关联 .总结 .整合 ,最 终 得 到 6 个 主 范畴 (B1- 
B6) :多 源 数据 .叙事 声音 、 视 觉 效 果 、 叙 述 逻 辑 .关联 
应 用 、 辅 助 信息 ,主轴 编码 结果 见 表 3 。 
3.3.3 选择 性 编码 

选择 性 编码 是 深化 主 范畴 的 关联 关系 、 凝 练 核心 
范畴 和 用 “故事 线 ” 描述 现象 的 重要 阶段 ”” 。 本 文 
对 主轴 编码 形成 的 6 个 主 范畴 系统 分 析 , 梳 理 主 范畴 
与 数据 故事 化 实践 应 用 的 关联 关系 ,从 而 建立 主 范畴 
的 关系 结构 见 表 4。 
3.3.4 ”理论 饱和 度 检验 

理论 饱和 度 是 对 扎根 理论 应 用 后 最 终结 果 的 检验 ， 
主要 运用 额外 数据 资料 检验 是 否 出 现 新 范畴 ,从 而 决定 
是 否 停止 采样 ”' ,选取 新 华 网 7 个 卫生 健康 类 数据 新 闻 
检验 理论 饱和 度 。 由 1 位 博士 生 进 行 饱和 度 检 验 ,未 发 
现 数据 新 闻 的 新 范畴 ,因而 认为 该 样本 达到 了 饱和 。 


4 数据 故事 化 实践 路 径 的 理论 模型 构建 


4.1 数据 新 闻 原 有 生产 过 程 

M. Lorenz ”给 出 了 数据 新 闻 的 生产 过 程 :数据 - 
过 滤 - 可视化 -故事 , 见 图 3。 

数据 经 过 过 滤 和 可 视 化 并 在 特定 情境 下 进行 阐 
释 ,从 而 形成 故事 。 在 此 过 程 中 , 原 有 数据 会 转化 为 有 
意义 的 知识 ,增加 了 公众 的 感知 价值 ,特别 是 当 复 杂 的 
数据 (事实 ) 被 归结 为 一 个 清晰 的 故事 时 ,更 易于 公众 
理解 和 认 知 。M. Lorenz 的 数据 新 闻 生 产 过 程 的 研究 对 
数据 故事 化 研究 具有 宏观 的 理论 指导 意义 。 本 文 在 M. 
Lorenz 的 数据 新 闻 生 产 过 程 的 理念 上 ,更 加 关注 叙事 者 
的 主导 地 位 及 公众 对 数据 故事 生成 路 径 的 微观 认 知 ， 
而 需要 进一步 细 粒 度 地 构建 数据 故事 化 的 实践 路 径 。 
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表 2 


初始 范畴 初始 概念 


卫生 健康 类 数据 新 闻 表 征 特质 的 开放 式 编码 结果 及 范畴 


原始 资料 (部 分 ) 


a9 疑问 类 题目 
al3 反问 类 题目 
al4 引导 类 题目 
a22 概括 类 题目 
a23 呼吁 类 题目 
25 趣味 类 题目 


Al 故事 题名 


A2 数据 来 源 a6 数据 来 源 高 校 
a20 数据 来 源 商业 领域 
a32 数据 来 源 政府 
a42 数据 来 源 公共 领域 

A3 可 视 化 统计 图 表 。 al 坐标 图 a3 散 点 图 
a5 和 矩阵 图 a7 数据 地 图 
all 等 级 图 表 al5 时 间 轴 

军 一 al8 折线 图 al9 环 状 区 

> a21 柱状 图 a26 饼 攻 

LO a29 条 形 图 a46 动态 图 表 
局 和 国画 展示 a37 漫画 形式 a38 简 笔 画 
45 立 数据 凸显 a41 数据 凸显 

人 Gy 事 背 虹 a43 开场 白 


22 解释 型 叙述 形式 


a4 启发 式 叙 述 形式 


a8 呼吁 类 人 氢 述 形式 

a24 疑问 类 叙述 形式 

a33 问题 - 自 答 叙述 形式 
a35 对 比 类 叙述 形式 


202304.0 


IV 


ad5 陈述 型 叙述 形式 


洲 
hl 


制作 者 


chinaX 


a27 监制 
a28 编辑 
a34 设计 
a30 数 
a31 数据 新 闻 微 信 公 众 号 
a40 数据 新 闻 二 维 码 

al0 设计 制作 单位 

al6 备注 信息 


A9 外 链 应 用 


A10 其 他 信息 


a36 联系 方式 
a39 版 权 声明 
a44 网 址 链接 
ad7 类 比 叙 寻 
a48 网 状 


A1ll 叙事 形式 


党 
nl 
1 


a49 线 怕 


疆 
党 
nl 
1 


a50 延伸 叙事 


居 新 闻 客户 端 二 维 码 


《湖北 一 夜 之 间 新 
《来 自 各 种 理由 的 


曾 新 冠 肺炎 病例 14840 例 ,为 什么 ?》 
重 不 着 ”你 的 睡眠 还 好 吗 ?》 


《这 里 有 一 份 属于 你 的 身体 健康 说 明 书 》 


《北京 12 名 确 
《 别 再 喝 红糖 水 了 , 教 你 科学 治疗 缺 铁 性 贫血 》 


诊 病 例 主要 活动 轨迹 》 


《 太 “ 秃 " 然 ? 防 脱发 小 妙招 了 解 一 下 !》 


《美国 约翰 斯 ， 堆 普 金 斯 大 学 》 


《中 国 移动 互联 网 数据 库 2020 年 2 月 》 
《中 国 疾病 预防 控制 中 心 》 


丁香 园 42019 年 国民 健康 洞察 报告 》 

数据 新 闻 里 使 用 了 坐标 图 , 散 点 图 ,矩阵 图 ,数据 地 图 …… (由 于 可 视 化 统计 图 表 均 使 用 图 形 , 故 本 
文 原始 资料 以 文字 代替 ) 

数据 故事 里 使 用 了 漫画 及 简 笔 画 ( 由 于 漫画 形式 \ 简 笔画 均 使 用 图 画 , 故 本 文 原始 资料 以 文字 代替 ) 
数据 新 闻 单 数据 凸显 采用 字体 变 大 或 改变 数字 颜色 …… 

冠 心病 、 高 血压 、 呼 吸 系统 疾病 …… 吸 烟 严 重 危害 人 民 的 身心 健康 。5 月 31 日 是 世界 无 烟 日 ,让 我 
们 一 起 向 烟草 说 “不 ”。 


艾滋 病 


您 是 糖尿 病 高 危 人 群 四 ?具备 以 下 因素 之 一 , 即 为 糖尿 } 
压 , 收 缩 压 三 140mmHg 和 (或 ) 舒张 压 记 90mmHg……: 
隶 癌 你 要 这 么 做 ! 坚持 银 炼 .避免 熬夜 .坚持 母乳 喂养 .坚持 健康 体检 、 健 康 饮食 戒烟 戒 酒 …… 


28kg/m?;(2) 高 ff 


预防 乳 
你 吃 的 
得 了 缺 


离 你 我 并 不 遥远 ? 截止 2018 年 8 月底 ,全 国 


健康 吗 ? 
铁 性 贫 


你 是 运动 达 人 吗 ? 你 的 眼睛 清晰 吗 ? 


亿 、2020 年 春节 8. 50 亿 、2020 年 春节 后 8.49 亿 . .. 
临床 诊断 病例 :是 尚 不 具备 病原 学 证 据 , 但 具备 临床 表现 .肺炎 影像 学 特征 的 患者 …… 


湖北 省 


策划 : 刘 舒 


文案 : 蒋 燕 邓 思 敏 (实习 ) 
监制 : 展 鹏 彭 嘉 靖 
编辑 : 刘 品 彤 
设计 : 冯 光 明 


数据 新 
代替 ) 


设计 制 


备注 信息 ,时 段 定义 :2019 年 春节 指 2019 年 2 月 4 日 -10 日 .2020 年 平日 指 2020 年 
年 春节 指 2020 年 1 月 24 日 -2 月 2 日 2020 年 春节 后 指 2020 年 2 月 3 日 -9 日 


闻 给 出 了 二 维 码 或 公众 号 ( 


作 : 陕 西 频 道 


民 告 存活 感染 者 85 万 , 死 


咋 办 ? 药物 治疗 病因 治疗 输血 治疗 …… 


2019 -2020 年 不 同时 段 移动 互联 网 用 户 概况 :( 图 表 对 比 )2019 外 


于 二 维 码 和 微 信 公 众 号 均 以 


亡 26.2 万 例 …… 了 


顺 高 危 人 群 (1) 超 重 与 肥胖 ;体重 指数 > 


FE 春节 8. 39 亿 、2020 级 


了 
本 
二 


二 


标 呈 现 , 故 本 文 原始 资料 以 文字 


1 月 2 日 -8 日 .2020 


比较 , 增 速 高 达 2013. 54%…… 


了 几 个 月 的 人 们 , 面 


用 ) 一 2 月 11 日 (黄陂 区 体育 


联系 电话 :010 -88050306 

新 华 网 版 权 作品 ,请 获取 授权 后 转载 

更 多 精彩 尽 在 http://news. cn/ datanews 

我 国 目 前 口罩 和 呼吸 防护 相关 企业 超 8.5 万 家 ,新 增 超 3.1 万 家 ,与 去 年 同 基 
展开 平 铺 报道 :今年 “五 一 " 连 休 5 天 ,是 大 小 长 假 政策 实施 多 年 来 的 首次 。 完 
对 着 大 好 春光 和 5 天 假期 ,是 选择 继续 宅 着 还 是 出 行 呢 ? 

时 间 轴 :2 月 5 日 晚 10 点 (位 于 武汉 会 展 中 心 的 江汉 方 舱 医 院 率先 启 

馆 方 舱 医 院 启 用 ) 一 2 月 12 日 …… 

通过 对 2013 年 和 2018 年 全 球 护士 数据 对 比 ,预测 2030 年 前 ,护士 毕业 生 总 数 
可 解决 所 有 国家 的 短缺 …… 


EF 均 每 年 需 增 8% , 才 
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以 数据 新 闻 为 例 [J]. 图 书 情报 工作 ,2021 ,65(14) :119 -127. 


表 3 卫生 健康 类 数据 新 闻 表征 特质 的 主轴 编码 结果 


主 范畴 初始 范畴 范畴 内 池 
B1 多 源 数据 A2 数据 来 源 提供 原始 数据 来 源 ,便于 受众 再 次 创作 
B2 叙事 声音 A8 故事 制作 者 参与 故事 制作 的 主要 人 员 


B3 视觉 效果 


A3 可 视 化 统计 图 表 A4 图 画展 示 A5 单数 据 凸显 


利用 可 视 化 给 受众 带 来 感知 上 的 美好 体验 


B4 叙事 逻辑 Al 故事 题名 A6 故事 背景 A7 叙事 句法 Al1 叙事 形式 借助 叙事 使 数据 讲 故事 符合 受众 的 认 知 
B5 关联 应 上 A9 外 链 应 用 提供 多 设备 的 跨 屏 交互 
B6 辅助 信息 A10 其 他 信息 提供 公众 了 解 故事 的 相关 信息 


表 4 主 范畴 与 数据 故事 化 实践 的 关系 


典型 关系 关系 结构 
多 源 数据 一 数据 故事 化 实践 数据 来 源 对 数据 新 闻 实践 起 核心 作用 
叙事 声音 一 数据 故事 化 实践 叙事 人 员 对 数据 新 闻 实 践 起 主导 作 
视觉 效果 一 数据 故事 化 实践 视觉 效果 对 数据 新 闻 实 践 起 支撑 作 / 
叙事 逻辑 一 数据 故事 化 实践 叙述 逻辑 对 数据 新 闻 实 践 起 推动 作 / 
美 联 应 用 一 数据 故事 化 实践 关联 应 用 对 数据 新 闻 实践 起 扩散 作 / 
辅 衣 信 息 _, 数 据 故 事 化 实践 辅助 信息 对 数据 新 闻 实践 起 协助 信息 
< 
Ie, 
© sm 
© Visualize \ 
本 Filter 

< 二 Data 
全 RE 
SS ng 
© a i 
ON 图 3 数据 新 闻 的 生产 过 程 

> 

人 

SC 
二 

© 


数据 预 处 理 | ”数据 合理 性 检验 
数据 去 重 游程 检验 矩阵 树 图 
抽样 分 析 


4.2 理论 模型 构建 

基于 前 文 对 数据 新 闻 的 编码 ,数据 新 闻 的 可 视 化 
操作 工具 及 数据 处 理 过 程 无 法 通过 编码 获取 ,为 了 保 
证 数据 新 闻 实践 路 径 的 完整 系统 性 ,通过 文献 调查 补 
充 了 数据 可 视 化 转化 需要 的 隐藏 信息 ”” ” 。 最 终 从 
叙事 声音 、 多 源 数据 .视觉 效 果 、 叙 事 逻辑 .关联 应 用 、 
辅助 信息 6 个 维度 构建 了 数据 故事 化 实践 路 径 的 理论 
模型 ,如 图 4 所 示 : 
4.3 理论 模型 分 析 与 讨论 
4.3.1 叙事 声音 

叙事 声音 即 叙事 者 ,包括 策划 编辑 .监制 .设计 等 
人 员 ,数据 可 视 化 过 程 中 还 需要 技术 人 员 (I 开 技术员、 
数据 分 析 师 等 ) 。 数 据 故事 的 叙事 声音 可 以 是 人 或 者 
智能 设备 ,打破 了 传统 叙事 中 “作者 ”的 叙事 话语 权 。 
叙事 声音 主导 着 数据 故事 的 制作 ,贯穿 了 故事 “ 选 题 - 


缺失 数据 预测 | | 


图 4 数据 故事 化 实践 路 径 的 理论 模型 


数据 过 滤 -视觉 效果 - 叙事 ”的 始终 。 统 事 者 专业 水 
平 直接 影响 数据 故事 的 成 品 效果 ,因而 叙事 声音 的 配 
备 需 要 依据 数据 故事 的 选 题 。 在 27 个 卫生 健康 类 数 
据 新 闻 中 有 技术 人 员 借 用 Excel、PowerBI、Tableau、Py- 
thon \R 语言 等 工具 对 数据 进行 预 处 理 ,合理 性 检验 、 视 
觉 效 果实 现 等 ,从 而 构成 了 分 工 明 确 的 叙事 声音 链 。 
4.3.2 多 源 数 据 
数据 是 数据 故事 化 的 核心 ,主要 来 源 于 政府 开放 
数据 、 公 共 数 据 、 科 研 数据 和 商业 数据 等 ,如 《图 说 90 


后 的 养生 焦虑 》 的 数据 来 源 有 3 个 :丁香 园 (2019 国民 
健康 洞察 报告 兴 阿 里 数据 》\Analysys 易 观 《90 后 健康 
养生 大 揭秘 2019》, 说 明了 数据 来 源 多 样 性 及 客观 严 
说 性 。 故 事 选 题 分 为 主题 驱动 (调查 型 数据 新 闻 ) 和 
数据 驱动 (常规 型 数据 新 闻 ) 两 类 ,其 中 主题 驱动 
围绕 故事 主题 采集 数据 , 选 题 偏重 于 社会 民生 等 热 
点 事件 ;数据 驱动 是 基于 已 有 数据 集 来 确定 选 题 。 
主题 驱动 较 数据 驱动 更 能 体现 数据 新 闻 传 播 的 实效 
性 ,故而 备 受 青睐 ”” 。 新 华 网 27 个 数据 新 闻 主 要 为 
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主题 驱动 类 型 ,更 符合 受众 偏好 ,传播 效率 高 。 确 定 
数据 后 ,还 需 :数据 预 处 理 。 叙 事 者 需要 进行 数据 
去 重 格式 统一 以 及 剔除 异常 和 错误 数据 等 工作 ,以 
保证 数据 准确 性 。@ 数 据 合理 性 检验 。 数 据 合理 性 
检验 是 对 数据 预 处 理 结果 的 再 次 验证 ,确保 无 异常 
值 及 非 理 性 数据 。 
4.3.3 视觉 效果 

根据 图 片 优势 效应 ,数据 新 闻 的 视觉 效果 不 仅 
提高 公众 的 外 显 记忆 ,更 能 刺激 其 内 隐 记 忆 , 从 而 调节 
公众 认 知 的 意义 建构 ,降低 数据 解读 的 复杂 度 。 视 觉 


4.3.5 关联 应 用 

数据 新 闻 的 关联 场景 是 受众 在 何 种 载体 下 接受 数 
据 新 闻 故 事 ,载体 包括 手机 端 .平板 端 、 网 页 端 。27 个 
卫生 健康 类 数据 新 闻 虽 然 设 置 了 微 信 公众 号 .手机 端 、 
PC 端 等 接受 场景 ,但 存在 以 下 问题 :数据 新 闻 应 用 到 
不 同 的 设备 环境 下 未 能 差异 化 适 配 ;数据 新 闻 也 未 设 
置 反馈 环节 ,受众 无 法 评价 数据 新 闻 质 量 的 优 劣 。 
4.3.6 辅助 信息 

辅助 信息 是 为 受众 提供 更 多 了 解数 据 新 闻 的 相关 
信息 ,包括 设计 制作 单位 、 备 注 信息 、 联 系 方式 版 权 


果 由 可 视 化 统计 图 表 、 图 画展 示 .单数 据 凸显 3 个 范 
构成 ,其 中 可 视 化 统计 图 表 是 关键 范畴 。 可 视 化 是 
以 数字 化 图 像 形 式 展现 ,运用 计算 机 图 像 学 .图 像 处 理 
技术 将 数据 转换 成 图 形 ,直观 揭示 数据 中 隐 含 的 信 
自习 。 新 华 网 27 个 卫生 健康 类 的 数据 新 闻 的 可 视 化 
统 评 图 表 和 图 画展 示 类 型 丰富 ,如 动态 图 表 常 与 时 间 
负 $ 歌 据 地 图 结合 ,以 动态 的 方式 表征 复杂 的 数据 ,从 

蔓 好 地 协助 理解 ;单数 据 凸 显 是 指 在 文本 中 以 醒目 


颜 稳 和 字体 大 小 显现 单个 数字 ,有 利于 公众 快捷 的 捕 


时 洲 


据 光 刍 信 息 。 数 据 新 闻 的 视觉 效果 本 质 上 是 对 新 闻 故 
悍 则 紧 就 简 , 强 调 主题 ,将 清晰 ,简洁 的 故事 主旨 传递 
纵 代 众 。 


CN 


叙事 逻辑 
.三 数据 新 闻 的 叙事 逻辑 是 通过 叙事 形式 ,叙述 句法 
, 训 守 题名 故事 背景 4 个 范畴 描述 故事 发 生 的 全 景 ， 
从 顺和 攀 成 完整 的 氢 事 结 构 。 数 据 新 闻 的 叙事 形式 表现 
为 事件 间 的 连接 规律 ,主要 的 叙事 形式 有 :中线 性 所 
事 加 通常 按照 事件 演进 过 程 ,采用 时 间 轴 表现 故事 的 
开端 发展. 高潮、 结局 。 加 延伸 叙事 。 延 伸 叙 事 是 对 
叙事 主线 进行 延伸 ,形成 联想 叙事 预测 分 析 及 时 空 拓 
展 。@ 类 比 叙 事 。 类 比 叙事 是 根据 “变量 "列举 不 同 
类 别 信息 以 发 现 数 据 规律 。@ 网 状 叙事 。 网 状 叙事 是 
通过 信息 图 展开 平 鱼 方 式 报道 。 本 研究 中 的 27 个 
数据 新 闻 从 传统 单一 节点 转向 点 面 结合 的 叙述 形式 ， 
多 种 叙事 形式 通常 交叉 使 用 ,如 《来 了 ! 新 型 肺炎 疫情 
最 新 事实 ) 同 时 采用 线性 、 网 状 、 类 比 3 种 叙事 形式 。 


声明 、 网 址 链接 等 。 辅 助 信息 是 数据 故事 化 整个 实践 
过 程 中 的 外 延 信息 ,为 受众 进一步 获取 故事 信息 提供 
相关 渠道 ,有 利于 受众 持续 性 的 关注 数据 故事 的 发 展 。 
4.4 数据 故事 化 的 特征 

根据 数据 故事 化 的 实践 路 径 归 纳 出 3 个 特征 : 
@D 利 用 故事 背景 引导 受众 感知 情境 。 数 据 故 事 通过 引 
入 关联 性 .丰富 性 .趣味 性 的 背景 导读 信息 ,激发 受众 
的 好 奇 心理 和 情境 依赖 。 受 众 在 特定 的 故事 情境 下 将 
明确 角色 设置 .语义 及 行为 ” 。@ 融 和 人 信息 图 表 刺 激 
受众 的 视觉 。 根 据 数据 类 型 选择 适 配 的 图 表 , 不 同 的 
信息 图 表 导 致 数据 应 用 场景 也 随 之 变化 所 ,K 线 图 适 
合股 票 交易 类 数据 、 词 云 适 合 展现 大 量 文本 和 文本 主 
题 的 视觉 效果 ,信息 图 表 刺 激 着 受众 的 视觉 感知 。 
@ 使 用 逻辑 故事 线 联结 受众 认 知 图 式 。 故 事 线 并 非 泛 
指 故 事情 景 线 索 , 也 称 故事 情节 或 知识 相关 性 ( 即 知识 
链 ) ,强调 事物 之 间 的 逻辑 关系 或 思维 结构 “ 。 受 众 
对 故事 的 理解 受 限 于 多 种 要 素 ,创作 者 在 深化 故事 主 
题 和 结构 时 需 注重 受众 的 逻辑 感知 体验 。 故 事 线 作为 
数据 故事 的 主要 脉络 ,其 设计 的 核心 思想 是 使 受众 深 
层次 参与 到 数据 故事 中 ,引起 高 阶 思维 的 分 析 、 评 价 、 
创造 ,实现 知识 的 隐 性 到 显 性 娘 变 。 数 据 故事 可 以 借 
鉴 艺术 .展览 行 业 的 故事 线 方法 , 层 层 铺展 故事 情节 ， 
逐步 引导 受众 理解 “1, 丰富 认 知 图 式 。 


5 ”数据 故事 化 的 实践 应 用 
数据 存在 于 政府 商业、 科研 等 多 个 领域 ,数据 故 


叙述 句法 有 解释 型 .启发 式 、 呼 吁 式 、 疑 问 式 等 ,丰富 了 
数据 的 表现 形态 。 故 事 题 名 是 故事 内 容 的 高 度 提 人 炼 ， 
而 故事 背景 具有 引导 性 ,有 利于 叙事 者 营造 氛围 。 统 
事 话 语 灵 活 多 变 , 叙 事 逻 辑 有 利于 连贯 多 个 故事 情节 
(情节 1+ 情 节 2 +…… 情节 n) 并 关联 匹配 到 多 种 情 
境 ( 情 境 1+ 情 境 2 + 情境 n) ,从 而 实现 故事 的 逻 
辑 顺应 。 


事 在 多 个 学 科 取 得 研究 进展 并 助 推 领域 知识 的 发 现 和 
传播 。 如 何 应 用 数据 及 说 何 种 故事 是 数据 故事 化 的 意 
义 5 。 本 文 探究 数据 故事 化 的 实践 应 用 ,有 助 于 促进 
其 纵向 延伸 和 横向 拓展 。 
5.1 用 于 知识 发 现 

牛 力 等 ”1 将 数字 人 文 的 理念 .方法 和 技术 应 用 于 
档案 领域 ,提出 了 档案 数据 的 “发 现 - 重 构 -故事 化 ” 
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以 数据 新 闻 为 例 [J]. 图 书 情报 工作 ,2021 ,65(14) :119 -127. 


为 主线 的 研究 路 径 , 重 构 档 案 知 识 , 多 视角 叙述 档案 夏 
事 ,发 据 档 案 数 据 价值 。 例 如 ,图 博 档 馆藏 资源 卷 快 洗 
繁 ,拥有 海量 数据 。 基 于 这 些 特 点 ,首先 ,对 多 源 异 构 
数据 资源 进行 深层 次 序 化 、 细 粒度 的 知识 组 织 , 实 现 不 
同 维度 的 数据 资源 向 知识 资源 转化 ;其 次 ,依据 数据 故 
事 化 原理 ,将 已 经 实现 知识 转化 的 数据 关联 ,并 采用 入 
事 学 方法 (如 空间 叙事 、 线 性 叙事 、 网 状 扳 事 ) 完 整地 
表达 数据 知识、 情景 与 事件 之 间 清 晰 的 层级 联系 , 形 
成 由 点 到 面 的 情节 层次 结构 ;最 后 ,根据 用 户 的 需求 ， 
选择 合适 的 可 视 化 呈现 方式 。 将 数据 故事 应 用 于 知识 
发 现 ,有 利于 公众 更 好 地 感知 .解读 和 认 知 复杂 数据 ， 


数据 故事 化 能 够 帮助 用 户 更 好 地 理解 .解读 和 重 
用 数据 及 挖掘 数据 潜在 价值 ,具有 广阔 的 应 用 前 景 。 
数据 故事 化 与 数据 新 闻 具 有 相同 的 元 素 和 叙事 手法 ， 
后 者 作为 前 者 的 主要 应 用 场景 。 本 文通 过 扎根 27 个 
卫生 健康 类 数据 新 闻 ,得 到 数据 故事 化 实践 路 径 的 理 
论 模型 及 特征 。 然 而 ,数据 故事 化 目前 处 于 探索 阶段 ， 
仍 存在 诸多 障碍 ,需要 多 学 科 领 域 共 同 丰 富 其 理论 及 
实现 方法 。 数 据 故事 化 可 应 用 于 知识 发 现 、 数 据 解读 、 
服务 增值 方面 。 后 续 将 扩大 数据 故事 化 的 研究 样本 并 


从 而 使 受众 更 好 地 理解 和 洞悉 数据 蕴涵 的 内 在 知识 与 
关联 语义 。 

5 部 - 用 于 数据 解读 

IO 


忆 大 数据 技术 能 够 挖 所 数据 并 呈现 可 视 化 结果 ,但 
缺 份 叙事 情节 ,不 利于 公众 解读 数据 。 数 据 故事 揭示 
于 笋 据 隐 在 的 逻辑 关系 ,通过 叙事 使 海量 数据 具备 了 
可 要 性 ,帮助 受众 把 控 数据 。 例 如 ,在 商业 领域 可 以 开 
发 次 据 故事 应 用 系统 或 APP, 当 公众 把 数据 输入 到 系 
统 融 APP 时 ,会 自动 生成 数据 故事 ,故事 降低 了 公众 
灼 括 认 知 负荷 。 另 外 ,企业 通常 采用 故事 方式 作为 品 
租 革 销 手段 ,但 是 数据 时 代 , 企 业 开始 关注 消费 者 为 主 
体 谭 政事 ,以 此 拉 近 与 消费 者 的 心理 距离 ,有 利于 形 逆 
品 怒 和 产品 的 形象 ,进而 提高 消费 者 的 参与 意识 。 
念 溪 根据 运营 目标 ,采集 并 过 滤 用 户 生成 内 容 ,在 特 害 
场 治 制作 出 符合 消费 者 认 知 的 数据 故事 ,形成 与 消费 
者 记忆 相 匹 配 的 事件 ,从 而 使 消费 者 在 认识 产品 过 程 
& 隐 速 了 解 产 品 ,做 出 合理 决策 。 
5.3 ”用 于 服务 增值 

数据 故事 能 够 根据 用 户 交互 行为 提供 个 性 化 服 
务 , 实 现 服务 增值 。 例 如 ,互联 网 促进 了 “ 读 屏 时 
代 ” 的 发 展 ,培养 了 读者 “碎片 化 .短平快 "的 阅读 方 
式 , 数 据 故事 化 的 表征 形式 高 效 地 迎合 了 读者 阅读 习 
惯 255 。 在 数据 故事 中 ,信息 图 表 适 合 叙事 空间 结构 、 
位 置 、 细 节 的 表达 ,而 文本 则 适合 抽象 信息 .口头 概念 
及 逻辑 条 件 的 传递 ' ,信息 图 表 与 文本 联合 编码 能 
时 激活 读者 的 多 种 认 知 图 式 类 型 ,提高 读者 阅读 效果 。 
数据 故事 通过 线性 .网 状 .类 比 组 合 等 多 种 叙事 形式 生 
成 多 线程 .模块 化 的 叙事 模块 ,读者 能 够 根据 自身 需求 
选择 单一 模块 或 多 种 模块 得 出 阅读 结果 。 图 书馆 可 以 
采用 读者 阅读 的 行为 数据 生成 普 适 性 的 故事 ,通过 网 络 
平台 ,社交 系统 应 用 APP 等 新 媒体 工具 展示 和 宣传 ,有 
利于 读者 选择 阅读 书籍 ,从 而 推动 图 书馆 的 服务 增值 。 


探究 相关 领域 的 具体 应 用 ,如 政府 开放 数据 或 科研 数 

据 的 故事 化 ,以 提升 此 类 数据 的 可 理解 性 、 逻 辑 性 、 灵 

活性 趣味 性 和 可 读 性 ,便于 公众 重用 数据 。 
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Practical Application Analysis of Data Storytelling: Taking Data News as an Example 
Zhou Xia Wang Ping Zhang Yunqi Song Jingxin Chen Weidong 
School of Management, Jilin University, Changchun 130022 

Abstract: | Purpose/significance | Data storytelling realizes the association and fusion of data, and narration, 
which is conducive to the public’ s perception and cognition of complex data, and improves the data reuse rate. 
| Method/ process | The author extracted 260 data news story titles from Xinhuanet and refined high-frequency 
words, based on this, identified 27 health-related hot data news stories. Based on the grounded theory and using the 
qualitative analysis software NVivoll, the author carried out three-level coding. Finally, 11 initial categories and 6 
main categories of data news practice were obtained. | Result/conclusion | Get the theoretical model and characteris- 
tics of the practice path of data storytelling. Data stories can be used for knowledge discovery, data interpretation, 
service value-added and other aspects. 


Keywords: data storytelling data news NVivo ll grounded theory logical narration 
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9. 智能 情报 分 析 技 术 与 平台 建设 全 35. 数字 图 书馆 的 扩展 /增强 现实 技术 应 用 研究 
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